ssp@c<&et document view Page 1 of 1 

Parallel computer network for multiple instructions and data - using common 
transmission rail to provide authorised access by all central processing units 
to data distributed throughout network 
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Abstract of DE4221278 

The parallel computer network includes several units (2) consisting of a CPU (3), a random-access 
memory (4) and a bus control unit (5) linked by an internal data bus (6). The units are interconnected 
by a data transmission rail (7). 

The bus control unit and CPU feature an additional connection for exchange of status information so 
that the CPU can have access to data from any unit (2) of the network. The RAMs are protected 
against unauthorised access by association of individual storage cells with additional control stores. 
ADVANTAGE - Data exchange between individual components of the network is performed without the 
programmer's intervention and with automatic data synchronisation. 
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Beschreibung voil zu verteilen ohne daB fur den Programmierer eine 

rx- j _ , t wesentliche Belastung bezuglich der Kommunikation 

Die vorliegende Erfindung bezieht sich auf ein Paral- entsteht - schlieBlich kann von alien CPU gleicherma- 

lelrechnernetzwerk nach dem Oberbegriff des Patent- Ben und gleichberechtigt auf die verteilten Daten zuge- 

anspruchsl. 5 griffen werden. 

Em gattungsgemaBes Parallelrechner- oder Daten- Das erfindungsgemaBe Parallelrechnemetzwerk wird 

yerarbeitungsnetzwerk ist Gegenstand des Patents ... im folgenden anhand der Zeichnung naher erlautert 

(Patentanmeldung P 41 27 192.0). Dabei sind jeweils Diesezeigtin 

mehrere CPU in GestaJt von Systemeinschuben grup- Fig. 1 eine Schemadarsteilung eines aus einer Mehr- 

penweise zusammengefaflt und jede dieser CPU-Grup- , 0 zahl von sogenannten Parallelrechnereinheiten aufge- 

pen ist uber einen PCU mit einem Datenbus gekoppelt bauten ParaJlelrechnernetzwerks; 

und so im Gesamtsystem integriert Die dabei zugrunde Fig. 2 eine Schemadarsteilung zur Erlauterung der 

gelegten CPU sind jeweils so zu verstehen und konfigu- Adressierung der Mehrzahl der Parallelrechnereinhei- 

nert, daB der notwendigerweise zugehdrige Speicher, ten; 

also der RAM ilber einen internen Datenbus mit der 15 Fig. 3 eine Schemadarsteilung eines RAM zur Erlau- 

CPU gekoppelt ist, und zwar jeweils so, dafl von dem terungder Zugriffssicherheit. 

PCU aus betrachtet die RAM den eigentlichen Prozes- Fig. 1 zeigt ein Parallelrechnemetzwerk 1, das aus 
soren. also den CPU, nachgeordnet sind Dies hat letzt- einer Vielzahl parallel zueinander angeordneter soge- 
hch zur Folge, daB bei emem Zugriff einer CPU auf den nannter Parallelrechnereinheiten 2 besteht beziehungs- 
Speicher einer beliebigen anderen CPU, urn etwa Daten 20 weise konfiguriert ist Unter einer Parallelrechnerein- 
m c I"**™™™* ^f/ugriff aber die heit ist im gegebenen Zusammenhang eine Rechenein- 
LINKS oder Schmttstellen der CPU erfoigt beziehungs- heit eines Rechners zu verstehen, der auf der Grundlage 
weise abgew.ckelt werden muB. Die Folge davon ist, einer Mehrdaten- und Vielfachinstruktionsmaschine 
daB diese funktiona en Verbindungen beziehungsweise (MIMD) basiert Diese Mehrdaten- und Vielfachinstruk- 
^peicherzugnffszyklen mcht nach dem sogenannten 25 tionsmaschine beziehungsweise Recheneinheit besteht 
Shared-Memory-Pnnzip, bei dem sich mehrere CPU jeweils aus einem Prozessor 3, der sogenannten CPU 
gleichberechtigt einen gemeinsamen Speicher teilen, einem Speicher 4, dem sogenannten RAM, und einer 
mdglich sind, da die CPU aktiv in den Ablauf eingreifen Bussteuereinheit 5, der sogenannten PCU. welche die 
mussen. V ie lmehr 1st es hierbei Aufgabe des Program- Verbindung eines internen Datenbus 6 und einer Daten- 
mierers fur den nchtigen Ablauf, dh. die richtige Ar- 30 ubertragungsschiene(D0-Schiene)7steuert 
beitsweise des Mehrrechnersystems, zu sorgen; glei- Die Recheneinheit ist in der Lage Programme gege- 
cnermaBen muQ auch die erforderliche Datensynchroni- benenfalls auch nur Programmabschnitte abzuarbeiten 
sation vom Programmierer bewaltigt werden. und kann - und zwar entsprechend der erfindungsge- 
«f r v ^ r , J e « enden Zusatzerfindung beziehungs- maflen Konfiguration - uber den internen Datenbus 6 
weise Weiterbildung des dem Patent . . . (Patentanmel- 35 sowohl auf den jeweils eigenen RAM 4, als auch - uber 
dung P 41 27 192.0) entsprechenden Datenverarbei- die PCU gesteuert - auf den RAM einer anderen paral- 
tungsnetzwerks zugrunde liegende Aufgabe besteht lei angeordneten Parailelrechnereinheit2zugreifen 
dann ein Parallelrechnemetzwerk der gattungsgemS- Die auf einer Paralielrechnereinheit eigenstandig lau- 
Ben Art anzugeben, bei dem der Datenaustausch zwi- fenden Programme beziehungsweise Programmab- 
schendeneinzelnen IComponenten ohne Vorgabe durch 40 schnitte werden im weiteren als TASK bezeichnet de- 
den Programmierer der Anlage erfoigt und bei dem die ren mehrere auf einer Paralielrechnereinheit 2 quasi 
Datensynchronisation weitestgehend autark und auto- gleichzeitig abgearbeitet werden konnen. Jedem TASK 
matischerfo gL ist eine eindeutige Jdentifikauonsnummer zugewiesen, 
Uiese Aufgabe wird durch die im kennzeichnenden beziehungsweise zugeordnet, die selbstverstandlich nur 
Jeil des Patentanspruchs 1 angegebene Verschaltung 45 einmal innerhalb des Parallelrechnernetzwerks 1 exi- 
bezienungsweise Kopplung der dem Parallelrechner- stieren darf. (Dies ist von besonderer Wichtigkeit, da in 
n^ W « r A w gr !f^ e he ^ enden Funktionselemente CPU, der vorliegenden Beschreibung die Identifikationsnum- 
PCU, RAM und Datenbus geldst mer der TASK zum Schutz der taskeigenen Daten, also 
hine besondere Ausgestaltung im HinbHck auf eine der Daten die keinesfails von einem anderen TASK be- 
sicnere Arbeitsweise der RAM sowie zur Vermeidung 50 nutzt werden durfen, verwendet wird) 
von Synchronisationsproblemen ist Gegenstand des Pa- In Verbindung mit dem vorliegenden Parallelrechner- 
tentanspruchsZ netzwerk kommt der Frage der eindeutigen Zugriffssi- 
Abgesehen von dem bereits aufgabengemaB beding- cherheit eine besondere Bedeutung zu. Dieses im nach- 
ten Vorteil, daB sich der Programmierer nicht urn die folgenden noch zu beschreibende LOCKING gewahr- 
Verteilung der Daten beziehungsweise Variablen inner- 55 leistet, daB ein RAM 4 gegen einen illegalen oder unzu- 
halb des Parallelrechnernetzwerks zu kummern lassigen Zugriff geschutzt ist 

braucht, besteht ein ganz besonderer Vorzug des erf in- Fur die Funktionsweise des Parallelrechnernetzwerks 

dungsgemaBen Parallelrechnernetzwerks in der erhah- ist ferner eine als Taskswitcher oder Scheduler bezeich- 

ten Virensicherheit. Da namlich ein Virus grundsatzlich nete Einheit von Bedeutung, die - fiir gewdhnlich im 

eine andere Programmspezifikation aufweist, als die der eo Betriebssystem integriert - die Umschaltung der akti- 

anderen Programme, kann er auch nicht auf die Daten ven TASK gewlhrleistet Dadurch wird zwar der Ein- 

beziehungsweise Variablen und den Code dieser ande- druck erweckt, daB mehrere TASK gleichzeitig verar- 

ren Programme zugreif en und Unheil anrichten. Ganz beitet werden - dieser Eindruck ist jedoch f alsch, da die 

allgemein zeichnet sich das im Vorstehenden charakte- TASK nacheinander abgearbeitet werden. Die genann- 

nsierte und im Detail nachfolgend zu beschreibende & te Umschaltung geschieht eben durch diesen Taskswit- 

Parallelrechnemetzwerk dadurch aus, daB innerhalb cher. 

dieses Parallelrechnernetzwerks die M6glichkeit be- Da der Taskswitcher eine fur die Funktionssicherheit 

stent, Daten im gesamten Parallelrechnemetzwerk sinn- des Parallelrechnernetzwerks wichtige Rolle spielt und 



DE 42 21 278 Al 



er weiterhin auch sehr schnell sein sollte und auf einen 
sogenannten, noch zu eriautemden DENIED-Zugriff 
reagieren muB, sollte er (mufl aber nicht) hardwarema- 
Big implementiert seia (Somit sollte aus Sicherheits- 
grunden die TASK-Identifikauonsnummer hardware- 
maBig vorgegeben werden). 
Die Konfiguration und Funktionsweise des Parallel- 
, rechnernetzwerks 1 wird — auf der Grundlage der 
Fig. 1 und der vorstehenden Begriffsspezifikationen — 
im Nachfolgenden naher erlautert: 

Die Verschaltung beziehungsweise Verdrahtung der 
Mehrzahl von Parallelrechnereinheiten 2 geht von den 
genannten PCU 5 aus, die direkt, d h. unmittelbar uber 
eine gewdhnliche DMA-ahnliche beziehungsweise 
-analogeZugriffsfunktion(DMA - Direct Memory Ac- 
cess) im RAM 4 der jeweiligen uber einen gemeinsamen 
Datenbus 7 gekoppeiten Parallelrechnereinheiten 2 ar- 
beiten, also die Busmasterfunktion fur den internen Da- 
tenbus 6 ubernehmen konnea Die genannte Busmaster- 
funktion wird durch Signale BUS-REQUEST (BREQ) 
und BUS-ACKNOWLEDGE (BACK) zwischen den 
Einheiten CPU 3 und PCU 5 gesteuert, wobei das SignaJ 
BREQ die Busfreigabeanforderung an die CPU 3 bedeu- 
tet und das Signal BACK die Busfreigabe signaiisiert 

Anders als beim Datenverarbeitungsnetzwerk des tl- 
teren Patents . . . (Patentanmeldung P 4! 27 I9Z0) kdn- 
nen die einzelnen Parallelrechnereinheiten 2 des Paral- 
lelrechnernetzwerks 1 uber ihre konjugierten PCU 5 
also jeweils direkt auf die RAM 4 der parallelen Paral- 
lelrechnereinheiten 2 zugreifen - die funktionalen Ver- 
bindungen brauchen also nicht mehr unter Zuhilfenah- 
me der CPU 3 abgewickelt zu werden. 

Das Ganze setzt insoweit jedoch auch eine modifi- 
zierte Adressierung voraus, und zwar wird jeweits zu- 
s&tzlich zur Adresse einer Parallelrechnereinheit 2 
(HEADER eine Adresse) noch die gewunschte Spei- 
cheradresse (Segment) ubertragen, aus der Daten bezie- 
hungsweise Variable gelesen beziehungsweise in die 
Daten beziehungsweise Variable eingeschrieben wer- 
den sollen. Jeweils nach Ablauf eines Zugriffs, d h. eines 
Speicherzyklus, erhalt die den RAM 4 beanspruchende 
CPU 3 ein Bestatigungssignal, ein Fehlersignal oder ein 
DENIED-Signal. 

Der Prozessorspeicher, d h. der RAM 4, ist als soge- 
nannte lineare Speicherbank organisiert GemaB Fig. 2 
besteht eine Adresse 10 dabei aus einem Segment 1 1 (Ao 
. . . Aj) und dem sogenannten HEADER 12 (Aj+ 1 . . . A„). 
Der HEADER 12 enthalt die Adresse der gewunschten 
Parallelrechnereinheit 2; das Segment 1 1 enthalt die ge- 
wunschte Adresse innerhalb des adressierten Speicher- 
raums. Ist der HEADER 12 dabei gleich der Adresse der 
aktuell zugreifenden CPU 3, so findet der Zugriff inner- 
halb des eigenen RAM 4 statt (vergleiche Pfeil X in 
Fig. 1); ist die Adresse ungleich, so wird die PCU 5 ange- 
steuert und dadurch der HEADER 12 an die DO-Schie- 
ne 7 iibergeben, gleichermaBen auch das Segment 11... 
sie dienen als Adresse fur den adressierten RAM (ver- 
gleiche Pfeil Y in Fig. 1) und die Parallelrechnereinheit 

Der weitere Zugriff ist wie folgt: Die durch einen 
HEADER 12 angesprochene Parallelrechnereinheit 2 
(dies ist anders als beim Patent . . . (Patentanmeldung P 
41 27 192.0) nicht eine CPU 3) gibt den Speicherzugriff 
auf die iibertragene Adresse frei, sofern aufgrund eines 
LOCKING kein Widerspruch entsteht. Nun kann die 
entsprechende CPU frei uber den Zielspeicherbereich 
in der Parallelrechnereinheit verfiigen, insbesondere 
den Zielspeicherbereich fur sich LOCKEN, sofern ein 
sogenannter Read-Modify-Write-Zyklus vorliegt Ist 



der Zyklus vollstandig beendet, so gibt die entsprechen- 
de CPU den Speicherblock der adressierten Parallel- 
rechnereinheit 2 wieder frei Zu bemerken ist insofern 
noch, daB die adressierte Parallelrechnereinheit auch 
5 wahrend eines Zugriffs auf ihren RAM 4 frei iiber den- 
selben verf Qgen kann, sofern einerseits kein Buskonflikt 
vorliegt, und andererseits sie nicht Speicherbereiche an- 
spricht, die etwa von anderen Parallelrechnereinheiten 
geLOCKt sind 
io StdBt eine Parallelrechnereinheit 2 auf ein Speicher- 
wort, das von einem anderen TASK als dem der zu- 
griffswiiligen Parallelrechnereinheit geLOCKt ist, so 
kann diese Parallelrechnereinheit nicht auf das Spei- 
cherwort zugreifen. Die entsprechende Parallelrechne- 
15 reinheit erhalt uber die DO-Schiene 7 ein DENIED-Si- 
gnal zuruck. Der Taskswitcher dieser Parallelrechne- 
reinheit 2 schaJtet nun sofort auf einen anderen lauffahi- 
gen TASK um, so daB letztlich die CPU keine Zeit durch 
Warten auf eine Speicherfreigabe verliert 
20 Zu bemerken ist, daB die Funktion des Taskswitcher 
eines der wichtigsten Merkmale des erfindungsgema- 
Ben Parallelrechnernetzwerks ist Grundsatzlich wird 
jeder Aufruf auf eine Speicherstelle, die a) nicht jedem 
TASK frei zur VerfQgung steht (vergleiche PUBLIC 
25 gemaB Fig. 3) beziehungsweise b) nicht dieselbe TASK- 
Identifikation wie die aufrufende TASK hat, mit der 
sofortigen Unterbrechung des aufrufenden TASKs quit- 
tiert Der TASK wird jedoch bei einer erneuten Aktivie- 
rung nochmals mit demselben Aufruf auf dieselbe Spei- 
30 cherstelle gestartet, d h. der TASK lauft erst an, wenn 
die aufzurufende Speicherstelle freigegeben (PUBLIC) 
ist Durch diese Technik wird nicht nur die Verwaltung 
der Daten beziehungsweise Variablen organisiert, son- 
dem es werden analog auch die TASK-Aufrufe gesteu- 
35 ert; TASK werden durch das Setzen eines Startbefehls 
in einer freien (PUBLIC) Speicherstelle aufgerufen. Der 
TASK testet die Speicherstelle - enthalt sie den Start- 
befehl, so startet er, ansonsten deaktivierj er sich selbst 
und zwar durch einen Befehl an den Taskswitcher. Dem 
40 aufgerufenen TASK wird eine Antwortspeicherstelle 
des aufrufenden TASKs - die frei zuganglich (PU- 
BLIC) ist - ubergeben. Dort setzt er ein Endesignal, 
sobald der TASK erfolgreich terminiert (beendet) ist. 
Der aufrufende TASK testet auf dieses Endesignal, so- 
45 fern eine TASK-Synchronisierung erforderlich ist 

Ist das Endesignal nicht gesetzt, so deaktiviert sich 
der TASK durch einen Befehl an den Taskswitcher 
selbst und startet erneut mit dem Test des Endesignals. 
Um letztendlich die Aktualitat der Daten beziehungs- 
50 weise Variablen zu gewahrleisten, insbesondere jedoch 
um zu verhindern, daB wahrend eines sogenannten Re- 
ad-Modify- Write-Zyklus falsche Informationen gelesen 
werden (wahrend eines Modify k6nme eine andere CPU 
die Daten lesen, welche allerdings bereits durch den 
55 Modify auf einer anderen CPU nicht mehr aktuell sind) 
ist ein Speicher-LOCK-Mechanismus vorgesehen. Hier- 
zu werden - vergleiche Fig. 3 - neben den Oblichen 
RAM 4 sogenannte Kontrollspeicher 14 implementiert, 
die Auskunft iiber die Zugriffsrechte geben. In diesem 
60 Kontrollspeicher 14 werden die Identifikationsnum- 
mern der TASK abgelegt, die den jeweiligen Speicher- 
elementen zugeordnet sind; daruberhinaus enthalt die- 
ser Kontrollspeicher 14 Informationen daruber ob das 
Speicherelement fur Fremdzugriffe freigegeben ist oder 
65 nicht (Variablen die fur Fremdzugriffe freigegeben sind, 
werden innerhalb der dazugehdrenden TASK als PU- 
BLIC bezeichnet - dieses Verfahren ist durch objekt- 
orientierte Programmiersprachen — vergleiche OOPS 
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— bekannt). 

Beispielsweise kann uber eine - vergleiche a) in 
Fig. 3 - aus lauter *W bestehende T>ate w angegeben 
sein, daB der als konjugierte Speicherplatz einem Zu- 
griff of fen, aJso die Variabel PUBLIC deklariert ist Ge- 5 
maB der in b) dargestellten Daten ist angegeben, daB 
der Speicher durch das Betriebssystem geLOCKt ist 

Das Beispiei c) zeigt, daB ein TASK mit der Identifika- 
nonsnummer T gerade auf den konjugierten zugreift; 
im Beispiei d) sei gezeigt daB prinzipiell die Moglichkeit to 
besteht, Variablen fQr Gruppen (Programme) zu LOK- 
KEN, indem zum Beispiei das hochstwertige Bit angibt, 
ob eine Gruppe (Gruppenidentifikation) oder eine 
TASK-Identifikation vorliegt 

GrundsatzJich stehen im System auch erweiterte 15 
Speicherzugriffe zur Verfugung: 

READ LOCK: Lesen und LOCKEN des Speichers (Ein- 
schreiben der eigenen Task-IDENTIFIKATION) 
WRITE LOCK: Schreiben und LOCKEN des Speichers 20 
(Emschreiben der eigenen Task-IDENTIFIKATION) 
READ UNLOCK: Lesen und UnLOCKEN des Spei- 
chers (Loschen der eigenen Task-IDENTIFIKATION) 
WRITE UNLOCK: Schreiben und UnLOCKEN des 
Speichers (Loschen der eigenen Task-IDENTIFIKA- 25 



Bei jedem Zugriff wird dabei getestet, ob der Spei- 
cher nicht von einem anderen Task gesperrt ist 

30 

Patentanspruche 

1. Aus einer Vielzahl von (im folgenden CPU ge- 
nannten) Prozessoren,(im folgenden RAM genann- 
ten) Speichern und (im folgenden PCU genannten) 35 
Bussteuereinheiten zur funktionalen Verbindung 
der CPU's uber eine (im folgenden DO-Schiene 
genannte) gemeinsame Datenubertragungsschiene 
bestehendes Parallelrechnernetzwerk nach Patent 
(PatentanmeIdungP41 27 192.0Xdadurchgekenii- 40 
zeichnet, 

daB je eine CPU (3), ein RAM (4) und ein PCU (5) 
eine Mehrdaten- und Vielfachinstruktionsmaschine 
(MIMD)bilden,und 

daB eine Vielzahl der Mehrdaten- und Vielfachin- 45 
struktionsmaschine (Parallelrechnereinheiten 2) 
flber die DO-Schiene (7) funktional derart mitein- 
ander gekoppelt sind, daB die DO-Schiene (7) un- 
mittelbar mit den PCU's (5) und diese uber einen 
internen Datenbus (6) einerseits mit der konjugier- 50 
ten CPU (3) und andererseits mit dem konjugierten 
RAM (4) verbunden sind, wobei PCU (5) und CPU 
(3) eine zusatzliche Verbindung zum Austausch von 
Statusinformationen aufweisen, so daB die CPU (3) 
auf die Daten beziehungsweise Variablen jeder be- 55 
liebigen Parallelrechnereinheit (2) zugreif en kann. 
2. Parallelrechnernetzwerk nach Anspruch 1, da- 
durch gekennzeichnet, daB die RAM's (4) gegen 
einen unberechtigten Zugriff dadurch geschutzt 
sind, daB den einzelnen Speicherzellen je eine zu- 60 
satzliche Kennung (Kontrollspeicher) zugeordnet 
ist 



Hierzu 1 Seite<n) Zeichnungen 



65 



ZEICHNUNGEN SEITE 1 Nummer: DE4221 278 A1 

IntCI.*: G06F 15/16 

Off enlegungstag : 5. Jamjar 1 994 




OOOOO/fO c) 



/lO/IOOOO cC) 



.3 



